Propósito

Convencerlos de:

  • La utilidad de visualizar datos
  • Visualizar datos es más poderoso que usar modelos matemáticos
  • No basar decisiones en anecdotas sensacionalistas
  • Organizar los datos sistemáticamente
  • No usar Microsoft Excel

No soy experto en COVID-19

  • Bachillerato en Matemática: UPR Río Piedras
  • PhD en Estadísticas: UC Berkeley
  • Estádistico Aplicado
  • Director y Professor en Dana-Farber Cancer Institute
  • Mi enfoque es en la génomica
  • Pero he trabajado en varias otras aplicaciones
  • @rafalab

Mis colegas que sí son expertos

  • Marc Lipsitch, Director, works on modeling the transmission of Coronavirus disease 2019.

  • Carolina Buckee, expert in transmission of infectious diseases through populations

  • Michael Mina, develops and tests high-throughput serological surveillance of infectious pathogens

Todos del Center for Communicable Disease Dynamics en Harvard

Marzo 11: Muy preocupado

Marzo 11: Muy preocupado

Marzo 15: Menos preocupado

Marzo 25: Preocupado otra vez

58,000 = 2% de la población!

Modelos estadísticos verus matemáticos

Son diferentes

  • Modelos matemáticos: hacen predicciones basados en ecuaciones diferenciales tratando de describir como funciona la naturaleza.

  • Modelos estadísticos: ajustan modelos a datos observados basado en modelos que han funcionado en el pasado para situaciones parecidas.

  • Visualización de datos: usa menos supuestos, pero permite descubrir patrones visualmente.

Italia y España hasta marzo 25

Nueva York, Massachusetts y Puerto Rico

Predecir es difícil

“It’s hard to make predictions especially about the future” - Yogi Berra

“Forecasting s-curves is hard” - Constance Crozier

Predecir es difícil

Muertes por día hasta hoy

Arizona, Texas, Florida

Arizona, Texas, Florida (close-up)

Tasa de positividad

  • Ya sabemos que la tasa de transmición es alta.
  • Se puede control con medidas como los lockdowns
  • Quizás el dato más importante entonces es el número o porciento de infectados \(I(t)\)
  • ¿Cómo lo estimamos?
  • El número de casos reportados no es un buen estimador

Casos en Puerto Rico

Source: Puerto Rico Institute of Statistics

¿Menos casos los fines de semana?

¿Tanto están creciendo los casos en EEUU?

Una razón es que se están haciendo muchas más pruebas

Tasa Positividad toma esto en cuenta

La tasa de positividad no está creciendo en todos los estados

Tasa de positividad

Trata de estimar la prevalencia: el porciento de rojos ya que no podemos probar a todos.

Tasa de positividad

Si solo hacemos pruebas a los sintomáticos el estimado es bien sesgado: mucho mayor que la tasa actual.

Tasa de positividad

Si hacemos pruebas más universalmente, el estimado es menos sesgado. Los casos reportados aumentan con el número de pruebas aunque no aumente la tasa.

Tasa de positividad

Si hacemos pruebas más universalmente nuestra precisión mejora. Pero si la tasa real es baja esto puede ser una desperdicio de recursos.

Problema en Puerto Rico

No se compartía cuántas pruebas se habían hecho.

Dashboard de Massachusetts

Dashboard de Massachusetts

Dashboard de Massachusetts

También monitorean las hospitalizaciones y muertes.

Información obtenida del dashboard de PR

Información obtenida del dashboard de PR

Información obtenida del dashboard de PR

Ahora tenemos datos

Obviamente esos resultados no son confiables. Pero ahora esto va a mejorar pues tenemos datos compartidos por:

  • Puerto Rico Public Health Trust
  • Departamento de Salud

Tasa de positividad en Puerto Rico

Hospitalizaciones

También tenemos datos de hospitalizaciones:

Hospitalizaciones

Una vez los datos están bien organizados, hacer una visualización es fácil:

hosp <- read_xlsx("data/Dash Total.xlsx")
hosp %>% 
  ggplot(aes(Fecha, `Total de Personas Hospitalizadas COVID`)) +
  geom_point() + geom_smooth(span = 0.3)

Exceso de Muertes

  • ¿Estamos subestiando el efecto de la pandemia?
  • Para tener una idea, podemos monitorear excesos de muertes.
  • Comparamos el total de todas las muertes a lo esperado basado en años normales.

Exceso de Muertes en EEUU

Exceso de Muertes en Puerto Rico

Muertes en marzo 2019: 2489

Muertes en marzo 2020: 2720

Estimar el exceso es más complicado que simplemente restar estos dos porque:

  • Hay variabilidad natural de año a año.
  • El tamaño de la población está cambiando.
  • La demografía de PR está cambiando: el porciento de viejos esta creciendo

Datos imcompletos

Otro reto es que los datos del reigstro demográfico toman como 45 días en estar completos:

Complicaciones 2: la población decrece, pero se pone más vieja

Complicaciones 2: la población decrese, pero se pone más vieja

Marzo en otro años

Aquí vemos porque no debemos comparar solo dos años:

Actualización

  • Hasta ahora no parece que hay un exceso de muertes preocupante en PR.
  • Esto puede cambiar, rápidamente.
  • En las próximas páginas mostramos ejemplos de años que si hubo exceso de muertes.

Año típico

María

Georges

COVID-19

Chikungunya

Recomendaciones

  • Organizen datos sistemáticamente
  • Monitoreen con visualizaciones: tasa de positividad, hospitalizaciones y muertes
  • Monitoreen por regiones geográficas
  • Mis colegas expertos dicen: Control de aeropuertos
  • Datos y código: https://github.com/rafalab/pr-covid

Agradecimientos

  • Joshua Villafañe Delgado (Departamento de Salud)
  • Danilo Trinidad Perez Rivera (Departamento de Salud)
  • José A. López Rodriguez (Registro Demográfico)
  • Wanda Llovet Díaz (Registro Demográfico)
  • Marcos López Casillas (PRST)
  • José Rodriguez Orenge (PRST)
  • Daniel Colón Ramos (Yale)
  • Caroline Buckee, Michael Mina, Marc Lipsitch (Harvard)
  • Natalie Dean (University of Florida)